本发明公开一种考虑语义背景的短文本分类器构造方法。包括:收集短文本样本集,记录每个样本集所来自的社区主题,人工对样本集中的每个短文本样本给定标签,短文本样本集与对应的标签集构成了训练集。利用短文本集对一个两层的长短时记忆(Long‑short term memory,LSTM)编解码重构网络进行训练,训练好的网络可以对输入的任一一个短文本进行编码,得到输入短文本的特征向量。求取来自相同或者类似社区主题的短文本的特征向量均值,每个特征向量均值看作是对应的社区主题的短文本的语义背景向量。每个短文本减去所对应的语义背景向量,得到新的短文本样本集。利用新的短文本集与其标签来训练一个短文本分类器,本发明可以应用在短文本分类的相关业务中。